人物簡介
畢業後在中國建設機械總公司工作,從事計算機套用研究和開發工作,先後於1995年和1996年兩度在香港科技大學計算機科學系做博士後研究工作。從1998年起在中科院自動化研究所模式識別國家重點實驗室語音、語言信息處理研究組工作,主要從事有關基於段特徵分布漢語語音識別方法、漢語語音合成、語音增強及計算聽覺場景分析等方面研究。主持和完成多項國家自然科學基金、北京市自然科學基金、國家重點基礎研究發展(973)計畫、國家863計畫等項目。
學術任職
1993年7-1997年12 中國建設機械總公司高級工程師
1995年5-1997年2 香港科技大學計算機科學系博士後研究員
1998年1- 中科院自動化所副研究員
學術成就
提出了基於多維單位球面和邏輯的前饋神經元網路學習算法,並成功套用於移動機器人路徑規劃和生油岩評價專家系統,該項研究工作獲林家翹套用數學二等獎。近年來,對基於段模型的大詞表漢語連續語音識別的聲學建模、快速解碼算法、語言模型、韻律模型等;漢語語音合成的基於語料庫拼接方法、基於HMM的參數合成、時長建模等;語音增強的基於多統計分布噪聲估計和聲學機理的濾波器設計等,以及計算聽覺場景分析的基於統計的多基音估計和基於聽覺機理的組織策略等進行了深入研究,取得多項重要科研成果。目前專利正在申請中。結合科研任務,指導培養了數十名博士、碩士研究生。主要完成的國家自然科學基金、863高技術發展計畫等如下:
1、“基於段特徵分布及聽覺機理的抗噪音語音識別方法”, 國家自然科學基金項目(編號:60172055);
2、“聽覺計算模型及其在說話人識別中的套用,”(與北京大學合作)自然科學基金重點項目(編號:69635020);
3、“馬爾柯夫類模型中NP問題的實用快速算法研究”九五“863”項目(編號:863-306-ZT06-01-03);
4、 “語音導航的GIS/GPS集成系統研究及其在PDA上的實現”, 北京市自然科學基金項目(編號:4002012);
5、“漢語通用語音庫和數據轉換算法的建立”,中科院知識創新工程領域前沿項目(編號:1M02J05);
6、“限定文本說話人確認技術研究及其在金融領域中的套用,”(與北京大學合作), 十五“863”項目(編號:2001AA114181);
7、“聲音個性化漢語語音合成方法關鍵技術研究,”北京市自然科學基金項目(編號:4042025)。
發表學術論文逾百篇,近年發表的部分論文:
1、劉文舉,孫兵,鍾秋海,“基於說話人分類技術的分級說話人識別研究,”電子學報,第33卷,第7期,pp1230~1233,2005年。
2、Yun Tang, Wenju Liu, Yiyan Zhang, Bo Xu, “A Framework for Fast Segment Model by Avoidance of Redundant Computation on Segment,” International Journal of Computational Linguistics and Chinese Language Processing, Vol. 11(1), pp73~86, Mar., 2006.
3、Yun Tang, Wen-Ju Liu, Hua Zhang, Bo Xu, Guo-Hong Ding, “One-pass Coarse-to-Fine Segmental Speech Decoding Algorithm,” Proceedings of ICASSP(International Conference on Acoustics, Speech, and Signal Processing, ) Vol.Ⅰ, pp441~444, May 14-19, 2006,Toulouse, France.
4、Kang Heng, and Liu Wenju, “Selective-LPC based Representation of STRAIGHT Spectrum and Its Applications in Spectral Smoothing,” Proc. of INTERSPEECH 2006-ICSLP(9th International Conference on Spoken Language Processing), pp2050~2053, September 17-21, 2006, Pittsburgh, Pennsylvania, USA.
5、Peng Li, Yong Guan, Wenju Liu and Bo Xu, “Monaural Speech Separation Based on Computational Auditory Scene Analysis and Objective Quality Assessment of Speech,” IEEE Transaction on Audio, Speech, and Language Prcessing,Vol.14, Num.6, pp2014~2023,November, 2006.
6、Wenju Liu, Yun Tang, and Shouye Peng, “Fast and Robust Stochastic Segment Model for Mandarin Digital String Recognition,” Proceedings of 2008 IEEE Congress on Computational Intelligence(WCCI 2008),pp.1446~1450, June 1-6,2008, Hong Kong, China.
7、Ning Cheng, Wen-Ju Liu, Peng Li, and Bo Xu, “An Effective Microphone Array Post-filter in Arbitrary Environments,” Proceedings of 9th Annual Conference of the International Speech Communication Association (Interspeech 2008), pp.439~442, 22-26 September 2008, Brisbane, Australia.
8、Wenju Liu, Yun Tang, and Shouye Peng, “Research on Segment Acoustic Model Based Mandarin LVCSR,” Proceedings of 6th International Symposium on Neural Networks, pp.928~935, ISNN 2009 Wuhan, China, May 26-29, 2009.
9、Xueliang Zhang, Wenju Liu, Peng Li, and Bo Xu,“MONAURAL VOICED SPEECH SEGREGATION BASED ON ELABORATE HARMONIC GROUPING STRATEGY,”Proceedings of ICASSP’2009(IEEE International Conference on Acoustics, Speech, and Signal Processing), pp.4661~4664, April 19~24, 2009, Taipei International Convention Center, Taipei, Taiwan.
10、Peng Li, Yong Guan, Shijin Wang, Bo Xu and Wenju Liu, “Monaural Speech Separation Based on MAXVQ and CASA for Robust Speech Recognition,” Computer Speech and Language 24 (2010) pp. 30~44.
在研課題
2007年-2009年“基於語音知識和全局最優準則指導的段模型漢語LVCSR方法研究,”國家自然科學基金項目項目負責人;
2004年-2009年“音頻場景分析,”國家重點基礎研究發展(973)計畫,項目實施負責人;
2007年-2008年“面向網路套用環境的口語翻譯關鍵技術與系統研究,” 863國家高技術研究發展計畫 (目標導向類項目),項目組長;
2007年-2008年“網路多模態有害內容的識別與過濾系統,” 863國家高技術研究發展計畫 (目標導向類項目),項目副組長;
2009年-2011年“基於客觀質量評估和音頻場景分析語音分離新方法研究,”國家自然科學基金重大研究計畫“視聽覺信息的認知計算”培育項目項目負責人。